35行代码下载任意网页的图片

Original 李运辰 Python研究者 2022-07-01

收录于合集

#小白入门 10 个

#爬虫 53 个

#采集 6 个

一、简介

有没有一种代码可能实现下载任意网页的图片，这样对于需要下载大量壁纸，图片的小伙伴来说真是一个好福利，今天我们就来试试。

先看视频演示效果

35行代码下载任意网页的图片_演示视频

https://v.qq.com/x/page/f3220zfigqq.html

二、分析

爬取过网页图片的小伙伴都知道，需要通过lxml去解析对应的网页，每一个网页的网页标签结构不一样，因此爬取一个网站的图片就需要解析一次，那想爬取多个网站时，那.....，（打扰了，告辞）

因此我们来看一下网页的图片存放在哪个网页标签

案例网页1

###网页链接http://desk.zol.com.cn/bizhi/9461_115065_2.html

案例网页2

###网页链接http://www.netbian.com/index.htm

案例网页3

###网页链接http://www.jj20.com/bz/mwjy/msdc/294138.html

通过这三个案例网站的分析可以发现图片都是在img标签下，因此根据这个规律可以写正则表达式去进行爬取图片。

三、代码

所需库

import reimport requests

re是正则表达式的库，requests用于获取网页数据

请求网页

#请求头 headers = {

        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36 Edg/87.0.664.75'

}#请求数据，其中url是目标网页web_text = requests.get(url, headers=headers).text

正则表达式

ex = '<img.*?src="(.*?)".*?'img_list = re.findall(ex, web_text)

获取图片链接

# 补充协议头if not (img.startswith('http') or img.startswith('https')): img = 'http:' + imgimg_binary = requests.get(img, headers=headers).content# 切割出最后一个字符串file_name = img.split('/')[-1]# 切割 query字符file_name = file_name.split('?')[0]

保存图片到本地

with open(f'./李运辰_img/{file_name}', 'wb') as fp: fp.write(img_binary)

四、效果演示

比如演示的图片链接

http://desk.zol.com.cn/bizhi/9461_115065_2.html

运行程序后

在本地文件夹可以看到爬取的图片

五、结尾

好了，以上就是完整的介绍，有问题的可以在下方评论，互勉互励，一起努力。

【完整源码获取方式】

公众号回复：万能图片爬虫

------------------- End -------------------

【各种爬虫源码获取方式】

识别文末二维码，回复：爬虫源码

------------- 往期精彩文章 --------------

python窃取摄像头照片（摄像头拍照+邮箱发送+打包exe）

30行爬虫代码实现中英互译

分析B站《送你一朵小红花》弹幕评论

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

白石洲拆迁后，那些上学奔波的孩子都去哪儿了？

一个医保局长之死

给宠物做保姆的中国留学生

本以为吴京大儿子叫“吴所谓”够随意了，听到二儿子名字，真服了

法院4.2元拍卖一瓶雪碧，限自提！被执行人回应：没有更多可供执行财产

35行代码下载任意网页的图片

先看视频演示效果

案例网页1

案例网页2

案例网页3

所需库

请求网页

正则表达式

获取图片链接

保存图片到本地

您可能也对以下帖子感兴趣

白石洲拆迁后，那些上学奔波的孩子都去哪儿了？

一个医保局长之死

给宠物做保姆的中国留学生

本以为吴京大儿子叫“吴所谓”够随意了，听到二儿子名字，真服了

法院4.2元拍卖一瓶雪碧，限自提！被执行人回应：没有更多可供执行财产

生成图片，分享到微信朋友圈

35行代码下载任意网页的图片

先看视频演示效果

案例网页1

案例网页2

案例网页3

所需库

请求网页

正则表达式

获取图片链接

保存图片到本地

您可能也对以下帖子感兴趣